Fine-grained semantic segmentation of a person's face and head, including facial parts and head components, has progressed a great deal in recent years. However, it remains a challenging task, whereby considering ambiguous occlusions and large pose variations are particularly difficult. To overcome these difficulties, we propose a novel framework termed Mask-FPAN. It uses a de-occlusion module that learns to parse occluded faces in a semi-supervised way. In particular, face landmark localization, face occlusionstimations, and detected head poses are taken into account. A 3D morphable face model combined with the UV GAN improves the robustness of 2D face parsing. In addition, we introduce two new datasets named FaceOccMask-HQ and CelebAMaskOcc-HQ for face paring work. The proposed Mask-FPAN framework addresses the face parsing problem in the wild and shows significant performance improvements with MIOU from 0.7353 to 0.9013 compared to the state-of-the-art on challenging face datasets.
translated by 谷歌翻译
Deep unfolding networks (DUNs) have proven to be a viable approach to compressive sensing (CS). In this work, we propose a DUN called low-rank CS network (LR-CSNet) for natural image CS. Real-world image patches are often well-represented by low-rank approximations. LR-CSNet exploits this property by adding a low-rank prior to the CS optimization task. We derive a corresponding iterative optimization procedure using variable splitting, which is then translated to a new DUN architecture. The architecture uses low-rank generation modules (LRGMs), which learn low-rank matrix factorizations, as well as gradient descent and proximal mappings (GDPMs), which are proposed to extract high-frequency features to refine image details. In addition, the deep features generated at each reconstruction stage in the DUN are transferred between stages to boost the performance. Our extensive experiments on three widely considered datasets demonstrate the promising performance of LR-CSNet compared to state-of-the-art methods in natural image CS.
translated by 谷歌翻译
近年来,强化学习及其多代理类似物在解决各种复杂控制问题方面取得了巨大的成功。然而,在其理论分析和算法的经验设计中,多机构的增强学习仍然具有挑战性,尤其是对于大量的体现的机器人剂,在这些机器人链中仍然是确定的工具链仍然是积极研究的一部分。我们使用新兴的最先进的均值控制技术,以将多机构群体控制转换为更经典的单位分布控制。这允许从单位加强学习的进步中获利,以假设代理之间的相互作用较弱。结果,平均场模型被带有体现的,身体碰撞的代理的真实系统的性质违反。在这里,我们将避免碰撞和对平均场控制的学习结合到一个统一设计智能机器人群行为的统一框架。在理论方面,我们为连续空间和避免碰撞的一般平均场控制提供了新颖的近似保证。从实际方面来说,我们表明我们的方法的表现优于多代理强化学习,并允许在模拟和真实无人机群中避免碰撞的同时进行分散的开环应用程序。总体而言,我们为群体行为设计框架提出了一个框架,该框架既有数学上有充分的基础,而且实际上有用,从而实现了原本棘手的群问题的解决方案。
translated by 谷歌翻译
多机构强化学习(MARL)领域已通过采用各种学习方法来控制挑战的多代理系统。这些方法中的许多方法都集中在Marl问题的经验和算法方面,并且缺乏严格的理论基础。另一方面,Graphon Mean Field游戏(GMFGS)为学习问题提供了可扩展且数学上有充分根据的方法,涉及大量连接的代理。在标准的GMFG中,代理之间的连接是随着时间的推移而无方向性,未加权和不变的。我们的论文介绍了彩色的Digraphon均值野外游戏(CDMFG),该游戏允许在随着时间的推移随着时间的推移而自适应的代理之间进行加权和定向链接。因此,与标准GMFG相比,CDMFG能够建模更复杂的连接。除了进行严格的理论分析(包括存在和融合保证)外,我们还提供了学习计划,并通过流行病模型和金融市场中系统性风险的模型来说明我们的发现。
translated by 谷歌翻译
尽管在过去几年中,多机构增强学习(MARL)的领域取得了长足的进步,但解决了大量代理的系统仍然是一个艰巨的挑战。 Graphon均值现场游戏(GMFGS)可实现对MARL问题的可扩展分析,而MARL问题原本是棘手的。通过图形的数学结构,这种方法仅限于密集的图形,这些图形不足以描述许多现实世界网络,例如幂律图。我们的论文介绍了GMFGS的新型公式,称为LPGMFGS,该公式利用了$ l^p $ Graphons的图理论概念,并提供了一种机器学习工具,以有效,准确地近似于稀疏网络问题的解决方案。这尤其包括在各个应用领域经验观察到的电力法网络,并且不能由标准图形捕获。我们得出理论上的存在和融合保证,并提供了经验示例,以证明我们与许多代理的系统学习方法的准确性。此外,我们严格地将在线镜下降(OMD)学习算法扩展到我们的设置,以加速学习速度,允许通过过渡内核中的平均领域进行代理相互作用,并凭经验显示其功能。通常,我们在许多研究领域中为大量棘手的问题提供了可扩展的,数学上有充分的机器学习方法。
translated by 谷歌翻译
可以使用X射线自由电子激光器的强脉冲和短脉冲直接通过单次相干衍射成像直接观察到自由飞行中孤立的纳米样品的结构和动力学。广角散射图像甚至编码样品的三维形态信息,但是该信息的检索仍然是一个挑战。到目前为止,只有通过与高度约束模型拟合,需要对单镜头实现有效的三维形态重建,这需要有关可能的几何形状的先验知识。在这里,我们提出了一种更通用的成像方法。依赖于允许凸多面体描述的任何样品形态的模型,我们从单个银纳米颗粒中重建广角衍射模式。除了具有高对称性的已知结构动机外,我们还检索了以前无法访问的不完美形状和聚集物。我们的结果为单个纳米颗粒的真实3D结构确定以及最终的超快纳米级动力学的3D电影开辟了新的途径。
translated by 谷歌翻译
在终生学习中,代理人在整个生命中都在不重复的一生中学习,就像人类一样,在不断变化的环境中。因此,终身学习带来了许多研究问题,例如连续领域的转移,这导致了非平稳的奖励和环境动态。由于其连续的性质,这些非平稳性很难检测和应对。因此,需要探索策略和学习方法,这些方法能够跟踪稳定的领域变化并适应它们。我们提出反应性探索,以跟踪和反应终生增强学习中持续的域转移,并相应地更新策略。为此,我们进行实验以研究不同的勘探策略。我们从经验上表明,政策阶级家族的代表更适合终身学习,因为它们比Q学习更快地适应了分销的变化。因此,政策梯度方法从反应性探索中获利最大,并在终身学习中显示出良好的结果,并进行了持续的领域变化。我们的代码可在以下网址提供:https://github.com/ml-jku/reactive-ecploration。
translated by 谷歌翻译
量子计算硬件的功能增加,并实现深量子电路的挑战需要完全自动化和有效的工具来编译量子电路。要以一系列与特定量子计算机体系结构有关的天然大门表达任意电路,对于使算法在量子硬件提供商的整个景观中可移植。在这项工作中,我们提出了一个能够转换和优化量子电路的编译器,针对基于穿梭的捕获离子量子处理器。它由剑桥量子计算机的量子电路框架pytket上的自定义算法组成。评估了广泛的量子电路的性能,与标准Pytket相比,与标准Qiskit汇编相比,栅极计数可以降低到3.6倍,最高为2.2,而我们获得的栅极计数与相似的栅极计数相比相比,针对AQT线性静态捕获离子地址架构的Pytket扩展。
translated by 谷歌翻译
在存在分组的协变量的情况下,我们提出了一个增强框架,以允许在组内和之间实施稀疏性。通过使用调整后的自由度同时使用组件和小组梯度提升,可以通过增强来拟合具有与稀疏组套索相似的模型。我们表明,组内和组间稀疏性可以通过混合参数来控制,并讨论稀疏组套索中混合参数的相似性和差异。通过模拟,基因数据以及农业数据,我们显示了该估计器的有效性和预测性竞争力。数据和模拟表明,在存在分组变量的情况下,稀疏组增强的使用与偏差的变量选择较少,并且与组件的增强相比,可预测性较小。此外,我们提出了一种减少偏见通过自由程度来提高组件的偏见的方法。
translated by 谷歌翻译
我们将存储系统视为任何技术认知系统的关键组成部分,这些系统可以在弥合用于推理,计划和语义场景的高级符号离散表示之间弥合差距,以了解用于控制,用于控制。在这项工作中,我们描述了概念和技术特征,其中的内存系统必须与基础数据表示一起实现。我们根据我们在开发ARMAR类人体机器人系统中获得的经验来确定这些特征,并讨论实践示例,这些例子证明了在以人为中心的环境中执行任务的类人生物机器人的记忆系统应支持,例如多模式,内态性,异性恋,Hetero关联性,可预测性或固有的发作结构。基于这些特征,我们将机器人软件框架ARMARX扩展到了统一的认知架构,该架构用于Armar Humanoid Robot家族的机器人。此外,我们描述了机器人软件的开发如何导致我们采用这种新颖的启用内存的认知体系结构,并展示了机器人如何使用内存来实现内存驱动的行为。
translated by 谷歌翻译